Information Gain
# Tag:
- Source/KU_ML
Information Gain
mutual information이라고도 한다.
두 확률 변수 와 간의 얼마나 정보가 공유되는 지를 나타낸다.
가 를 잘 설명하여 정보 공유량이 높을수록, 즉 Conditional Entorpy가 높을 수록 Information Gain은 작아지게 된다.
즉, 와 가 independent하여 의 불확실성이 최대라면, 정보 공유량인 Information Gain은 0이다.
Conditional Entropy
: 의 확률로 Expectation을 취한 것이라고 볼 수 있다.
즉, 라는 조건을 알고 있을 때의 에 대한 불확실성을 측정하는 개념.
:
- 최소값 : 가 주어졌을 때 에 대한 불확실성이 전혀 없음을 의미하며, 가 를 완벽하게 설명하는 경우이다.
- 최대값 : 가 에 대해 아무런 정보도 제공하지 않아 의 불확실성이 그대로 남아 있는 경우.